Ceil
逐元素计算输入张量的向上取整值。即返回大于或等于每个元素的最小整数。
\[\text{Output}_i = \lceil \text{Input}_i \rceil\]
- 输入:
input_x - 输入张量的数据地址。
input_size - 输入张量的总元素数量。
core_mask - 核掩码。
- 输出:
output - 输出张量的数据地址,其大小与`input_x`相同。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持fp32, double
MT7004 支持fp16, fp32
共享存储版本:
-
void fp_ceil_s(float *input_x, float *output, int input_size, int core_mask)
-
void hp_ceil_s(half *input_x, half *output, int input_size, int core_mask)
-
void dp_ceil_s(double *input_x, double *output, int input_size, int core_mask)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <ceil.h>
4int main(int argc, char* argv[]) {
5 float *input_x = (float *)0xA0000000; // input_x 在DDR空间
6 float *output = (float *)0xB0000000; // output
7
8 int input_size = 4096;
9 int core_mask = 0xff;
10
11 fp_ceil_s(input_x, output, input_size, core_mask);
12 return 0;
13}
私有存储版本:
-
void fp_ceil_p(float *input_x, float *output, int input_size)
-
void hp_ceil_p(half *input_x, half *output, int input_size)
-
void dp_ceil_p(double *input_x, double *output, int input_size)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <ceil.h>
4int main(int argc, char* argv[]) {
5 float *input_x = (float *)0x10000000; // input_x 在L2空间
6 float *output = (float *)0x11000000; // output
7
8 int input_size = 1024;
9
10 fp_ceil_p(input_x, output, input_size);
11 return 0;
12}